Análisis de Series Temporales
IOT Analytics
Preparación para analizar los datos. Series temporales
Objetivo
Proyección del consumo energético a través de series temporales.
Procedimiento
Estudiaremos los datos de consumo energético correspondientes a los años 2007 a 2009 a través de series temporales.
Haremos proyección de futuro para el año 2010 y compararemos los resultados con los datos reales de este último año (serie real).
Preparación para analizar los datos. Primera visualización
Evolución mensual del consumo. Años 2007-2009
Vamos a representar la serie por meses para cada submedidor y tambien para la energía global co granularidad mensual. En este caso, la frecuencia será 12, tenemos una observación por mes para los años 2007,8 y 2009.
Parece que los datos tienen estacionariedad (movimientos que se repiten cada año), esto ocurre para todas las variables.
Forecasting antes de descomponer la serie
Vamos a plicar regresión lineal a cada serie temporal, y veremos el valor de \(R^2\) y del error cuadrático medio.
Evolución mensual del consumo. Años 2007-2009
SM1. Cocina
Modelo
Call:
tslm(formula = tsSM1_Mensual ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-20522.7 -5190.9 215.7 6726.8 16702.8
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 66531.9 7294.5 9.121 4.21e-09 ***
trend -173.1 200.7 -0.862 0.397393
season2 -19137.6 9635.6 -1.986 0.059061 .
season3 -1263.5 9641.8 -0.131 0.896879
season4 -15856.4 9652.3 -1.643 0.114034
season5 -6134.4 9666.9 -0.635 0.531966
season6 -9988.0 9685.6 -1.031 0.313160
season7 -27046.6 9708.4 -2.786 0.010505 *
season8 -38674.8 9735.4 -3.973 0.000602 ***
season9 -10641.7 9766.3 -1.090 0.287159
season10 -15040.7 9801.3 -1.535 0.138536
season11 -6105.3 9840.3 -0.620 0.541071
season12 -3378.2 9883.2 -0.342 0.735595
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 11800 on 23 degrees of freedom
Multiple R-squared: 0.5796, Adjusted R-squared: 0.3603
F-statistic: 2.643 on 12 and 23 DF, p-value: 0.02184
Resultados:
Valor del coeficiente de determinación: 0.5796. Es un valor bajo, el modelo únicamente explica el 58% de la variabilidad total.
Hay tres coeficientes significativamente no nulos.
Predicción IC
Predicción para los próximos 20 días
SM2. Lavadero
Modelo
Call:
tslm(formula = tsSM2_Mensual ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-26325 -4033 1223 6470 16873
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 83389.3 7617.6 10.947 1.35e-10 ***
trend -898.9 209.6 -4.289 0.000274 ***
season2 -13475.5 10062.5 -1.339 0.193598
season3 7508.4 10069.0 0.746 0.463406
season4 -15023.1 10079.9 -1.490 0.149708
season5 -7727.5 10095.2 -0.765 0.451777
season6 -11683.0 10114.7 -1.155 0.259931
season7 -19075.8 10138.6 -1.882 0.072621 .
season8 -28408.6 10166.7 -2.794 0.010305 *
season9 -9204.4 10199.1 -0.902 0.376160
season10 4809.1 10235.6 0.470 0.642890
season11 -1696.0 10276.3 -0.165 0.870356
season12 -3191.5 10321.1 -0.309 0.759941
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 12320 on 23 degrees of freedom
Multiple R-squared: 0.6541, Adjusted R-squared: 0.4736
F-statistic: 3.624 on 12 and 23 DF, p-value: 0.003891
Resultados:
Valor del coeficiente de determinación: 0.6541. Es un valor bajo, el modelo únicamente explica el 65% de la variabilidad total.
Hay tres coeficientes significativamente no nulos.
Predicción IC
Predicción para los próximos 12 meses (año 2010)
Se prevee una bajada del consumo
SM3. AC y termo
Modelo
Call:
tslm(formula = tsSM3_Mensual ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-87112 -18443 4781 17647 82107
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 299382 23189 12.911 5.06e-12 ***
trend 1866 638 2.926 0.00761 **
season2 -50805 30631 -1.659 0.11077
season3 -29034 30651 -0.947 0.35336
season4 -64190 30684 -2.092 0.04768 *
season5 -54165 30730 -1.763 0.09125 .
season6 -85197 30790 -2.767 0.01097 *
season7 -144850 30863 -4.693 1.00e-04 ***
season8 -171144 30948 -5.530 1.27e-05 ***
season9 -69624 31047 -2.243 0.03486 *
season10 -52696 31158 -1.691 0.10430
season11 -37281 31282 -1.192 0.24550
season12 7092 31418 0.226 0.82341
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 37510 on 23 degrees of freedom
Multiple R-squared: 0.7577, Adjusted R-squared: 0.6312
F-statistic: 5.992 on 12 and 23 DF, p-value: 0.0001238
Resultados:
Valor del coeficiente de determinación: 0.7577. Es un valor que podría ser aceptable, el modelo únicamente explica el 76% de la variabilidad total.
Hay tres coeficientes significativamente no nulos.
Predicción IC
Predicción para los próximos 12 meses (año 2010)
Se prevee una bajada del consumo
Comparación de los coeficientes y resultados de cada modelo
| Submedidor | RMSE | R2 |
|---|---|---|
| Cocina | 11186.74 | 0.5796 |
| Lavadero | 10939.60 | 0.6541 |
| AC y TermoE | 57300.05 | 0.7577 |
El RMSE del modelo con mejor coeficiente de determinación es el más alto. Pero no hay que olvidar que el consumo eléctrico para el submedidor correspondiente al AC y termo eléctrico es el que más energía consume de todos con una diferencia muy grande.
Forecasting descomponiendo la serie (así ok)
Descomponer: quitar tendencia
Descomposición y visualización
Evolución mensual del consumo. Años 2007-2009
Submetering 1
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia decreciente.
Submetering 2
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia decreciente.
Submetering 3
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia creciente
Predicción con Holt-Winters (suavizado exponencial)
Sin estacionalidad
Sería interesante verlo también con estacionalidad, para ver si se mantiene o no la tendencia.
Tendencia de predicción (crecimiento o decrecimiento del consumo) y predicción teniendo en cuenta las componentes
Evolución mensual del consumo (sin estacionalidad). Años 2007-2009
Cocina
Parece un muelle.
La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
Lavadero
No arece un muelle.
La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
AC y termo eléctrico
No parece un muelle.
La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
Comparación de los coeficientes y resultados de cada predicción
En las gráficas de predicción, hemos observado que el ajuste no mantiene la tendencia de consumo energético de la serie.
| Submedidor | RMSE |
|---|---|
| Cocina | 20107.15 |
| Lavadero | 30744.09 |
| AC y TermoE | 183796.72 |
ME RMSE MAE MPE MAPE MASE
Training set 1731.629 15017.8 10866.91 0.9448979 21.30004 0.9150282
Test set -30340.790 36669.6 30805.71 -127.4678788 128.17932 2.5939388
ACF1
Training set 0.1996392
Test set NA
Evolución mensual del consumo (con estacionalidad). Años 2007-2009
Vamos a ver una predicción del consumo enegético de cada submedidor con el método de HW. En este caso, no eliminaremos la estacionalidad, para ver así si se mantiene la tendencia de consumo.
Cocina
Parece un muelle.
La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
Lavadero
No arece un muelle.
TENDENCIA CLARAMENTE DECRECIENTE. Tambien observamos esacionalidad
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
AC y termo eléctrico
No parece un muelle.
Suavizado exponencial de HoltWinters
Pronóstico de HoltWinters para el año 2010
Vamos a predecir las próximas 12 observaciones.
Comparación de los coeficientes y resultados de cada predicción
| Submedidor | RMSE |
|---|---|
| Cocina | 16362.16 |
| Lavadero | 27223.90 |
| AC y TermoE | 165249.73 |
ME RMSE MAE MPE MAPE MASE
Training set 1731.629 15017.8 10866.91 1.43523 22.90328 0.7191145
Test set 236296.355 248450.0 236296.36 75.28922 75.28922 15.6368416
ACF1
Training set 0.1996392
Test set NA
Comparación de resultados. Predicción antes y despues de eliminar la tendencia
En las gráficas de predicción de suaviazado exponencial, hemos observado que el ajuste cuando eliminamos la estacionalidad, no mantiene la tendencia de consumo energético de la serie. Sin embargo, al mantener la estacionalidad se puede apreciar como las predicciones ajustan la tendencia de la serie original
| Submedidor | RMSE con estacionalidad | RMSEDeco sin estacionalidad |
|---|---|---|
| Cocina | 16362.16 | 11186.74 |
| Lavadero | 27223.90 | 10939.60 |
| AC y TermoE | 165249.73 | 57300.05 |
Comparación de resultados. Predicción antes y despues de eliminar estacionalidad
| Submedidor | RMSE | RMSEDeco |
|---|---|---|
| Cocina | 20107.15 | 11186.74 |
| Lavadero | 30744.09 | 10939.60 |
| AC y TermoE | 183796.72 | 57300.05 |
Resultados más fiables y con menor error trás haber descompuesto la serie